AI资讯新闻榜单内容搜索- DeepSeek-

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

尽管 DeepSeek-R1 在单模态推理中取得了显著成功，但已有的多模态尝试（如 R1-V、R1-Multimodal-Journey、LMM-R1）尚未完全复现其核心特征。

来自主题: AI技术研报

8270 点击 2025-03-14 15:32

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

近年来，大语言模型（LLM）的快速发展正推动人工智能迈向新的高度。像 DeepSeek-R1 这样的模型因其强大的理解和生成能力，已经在对话生成、代码编写、知识问答等任务中展现出了卓越的表现。

来自主题: AI技术研报

8289 点击 2025-03-10 14:15

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

随着 DeepSeek-R1 的流行与 AI4Math 研究的深入，大模型在辅助形式化证明写作方面的需求日益增长。作为数学推理最直接的应用场景，形式化推理与验证（formal reasoning and verification），也获得持续关注。

来自主题: AI技术研报

5832 点击 2025-03-09 10:31

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

仅仅过了一天，阿里开源的新一代推理模型便能在个人设备上跑起来了！昨天深夜，阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B，其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。

来自主题: AI资讯

9198 点击 2025-03-07 17:12

百度文库、网盘接入 DeepSeek，这才是学生党真正想要的 AI

又一个「DeepSeek 王炸组合」，来了。2 月 28 日，两个国民级应用，百度文库和百度网盘，全量接入了 DeepSeek-R1 满血版。

来自主题: AI资讯

4455 点击 2025-03-06 10:34

第一个吃到DeepSeek红利的AI图像产品出现了？

在 R1 推理模型大火之后，全民接力集成 DeepSeek，有硅基流动这样的大模型云服务平台、有腾讯元宝这样的 Chatbot，甚至微信这样的顶流。但是，AI 图片类产品却鲜少有接入 DeepSeek R1 的新闻，而从 DeepSeek-R1 发布到 Krea 宣布上线新功能仅仅 10 天，这个反应应该是图像产品中最快的。

来自主题: AI资讯

4259 点击 2025-03-05 10:16

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

通过针对视觉的细分类、目标检测等任务设计对应的规则奖励，Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知，为视觉语言模型的训练开辟了全新路径！

来自主题: AI技术研报

7593 点击 2025-03-04 20:09

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。

来自主题: AI技术研报

9601 点击 2025-03-02 15:14

500万TPM+20msTPOT，火山引擎用「AI云原生」重构大模型部署范式

部署 DeepSeek 系列模型，尤其是推理模型 DeepSeek-R1，已经成为一股不可忽视的潮流。

来自主题: AI资讯

7188 点击 2025-02-26 14:22

一文详解：DeepSeek 第三天开源的 DeepGEMM

DeepSeek 开源周的第三天，带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型（MoE）计算，为 DeepSeek-V3/R1 的训练和推理提供强大支持，在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。

来自主题: AI技术研报

7881 点击 2025-02-26 10:46